智能论文笔记

Instance-dependent uniform tail bounds for empirical processes

Sohail Bahmani

分类： (统计)机器学习

2022-09-21

我们根据函数的个体偏差而不是考虑类别中最严重的偏差，为由一类函数索引的经验过程制定了统一的尾巴。尾巴结合是通过向标准通用链条参数引入初始“通缩”步骤来建立的。最终的尾巴绑定具有主要的复杂性分量，这是talagrand的$ \ gamma $ functional for deflated函数类功能的变体，以及一个依赖实例的偏差术语，该术语由合适的规范的适当缩放版本来衡量。这两个术语均使用基于相关累积生成函数制定的某些系数表示。当函数类位于给定（指数类型）Orlicz空间时，我们还为上述系数提供了更明确的近似值。

translated by 谷歌翻译

Anticancer Peptides Classification using Kernel Sparse Representation Classifier

Ehtisham Fazal , Muhammad Sohail Ibrahim , Seongyong Park , Imran Naseem , Abdul Wahab

分类：机器学习

2022-12-19

Cancer is one of the most challenging diseases because of its complexity, variability, and diversity of causes. It has been one of the major research topics over the past decades, yet it is still poorly understood. To this end, multifaceted therapeutic frameworks are indispensable. \emph{Anticancer peptides} (ACPs) are the most promising treatment option, but their large-scale identification and synthesis require reliable prediction methods, which is still a problem. In this paper, we present an intuitive classification strategy that differs from the traditional \emph{black box} method and is based on the well-known statistical theory of \emph{sparse-representation classification} (SRC). Specifically, we create over-complete dictionary matrices by embedding the \emph{composition of the K-spaced amino acid pairs} (CKSAAP). Unlike the traditional SRC frameworks, we use an efficient \emph{matching pursuit} solver instead of the computationally expensive \emph{basis pursuit} solver in this strategy. Furthermore, the \emph{kernel principal component analysis} (KPCA) is employed to cope with non-linearity and dimension reduction of the feature space whereas the \emph{synthetic minority oversampling technique} (SMOTE) is used to balance the dictionary. The proposed method is evaluated on two benchmark datasets for well-known statistical parameters and is found to outperform the existing methods. The results show the highest sensitivity with the most balanced accuracy, which might be beneficial in understanding structural and chemical aspects and developing new ACPs. The Google-Colab implementation of the proposed method is available at the author's GitHub page (\href{https://github.com/ehtisham-Fazal/ACP-Kernel-SRC}{https://github.com/ehtisham-fazal/ACP-Kernel-SRC}).

translated by 谷歌翻译

Feature Selection Enhancement and Feature Space Visualization for Speech-Based Emotion Recognition

Sofia Kanwal , Sohail Asghar , Hazrat Ali

分类：人工智能 | 机器学习

2022-08-19

强大的语音情感识别取决于语音特征的质量。我们提出语音功能增强策略，以改善语音情感识别。我们使用了Interspeech 2010挑战功能集。我们从特征集合和应用原理分析分析到子集中确定了子集。最后，这些功能水平融合。在应用特征以识别情绪之前，使用T分布的邻居嵌入（T-SNE）分析所得的功能集。将该方法与文献中使用的最新方法进行了比较。经验证据是使用两个著名数据集绘制的：情感语音数据集（EMO-DB）和Ryerson Audio-Visual Visual Envial语音和歌曲（Ravdess）分别用于两种语言，即德语和英语。与基线研究相比，我们的七个情绪中有六个情绪中有六个情绪中有六个情绪中有六个情绪中的六个情绪中的六个情绪中的六个情绪中的六个情绪中的六个情绪中的六个情绪中的六个情绪中获得了11.5 \％的平均识别增益，而RAVDESS数据集中的七个情绪为13.8 \％。

translated by 谷歌翻译

Hybrid Transformer Network for Deepfake Detection

Sohail Ahmed Khan , Duc-Tien Dang-Nguyen

分类：计算机视觉

2022-08-11

DeepFake媒体如今正变得广泛，因为具有易于使用的工具和移动应用程序可以生成现实的DeepFake视频/图像，而无需任何技术知识。随着在不久的将来的这一技术领域的进一步进步，预计深冰媒体的数量和质量也将蓬勃发展，同时使DeepFake Media成为传播错误/虚假信息的可能新的实用工具。由于这些担忧，深层媒体检测工具已成为必要。在这项研究中，我们提出了一个新型混合变压器网络，利用早期功能融合策略进行深击视频检测。我们的模型采用两个不同的CNN网络，即（1）XceptionNet和（2）效率网络B4作为特征提取器。我们在FaceForensics ++，DFDC基准测试中以端到端的方式训练两个功能提取器。我们的模型在具有相对简单的体系结构的同时，在对FaceForensics ++和DFDC基准进行评估时，取得了与其他更先进的最先进方法相当的结果。除此之外，我们还提出了新颖的面部切割增加以及随机切割的增加。我们表明，提出的增强改善了模型的检测性能并减少过度拟合。除此之外，我们还表明我们的模型能够从少量数据中学习。

translated by 谷歌翻译

Semantic Self-adaptation: Enhancing Generalization with a Single Sample

Sherwin Bahmani , Oliver Hahn , Eduard Zamfir , Nikita Araslanov , Daniel Cremers , Stefan Roth

分类：计算机视觉

2022-08-10

尽管进行了多年的研究，但跨域的概括仍然是深层网络的语义分割的关键弱点。先前的研究取决于静态模型的假设，即训练过程完成后，模型参数在测试时间保持固定。在这项工作中，我们通过一种自适应方法来挑战这一前提，用于语义分割，将推理过程调整为每个输入样本。自我适应在两个级别上运行。首先，它采用了自我监督的损失，该损失将网络中卷积层的参数定制为输入图像。其次，在批准层中，自适应近似于整个测试数据的平均值和方差，这是不可用的。它通过在训练和从单个测试样本得出的参考分布之间进行插值来实现这一目标。为了凭经验分析我们的自适应推理策略，我们制定并遵循严格的评估协议，以解决先前工作的严重局限性。我们的广泛分析得出了一个令人惊讶的结论：使用标准训练程序，自我适应大大优于强大的基准，并在多域基准测试方面设定了新的最先进的准确性。我们的研究表明，自适应推断可以补充培训时间的既定模型正规化实践，以改善深度网络的概括到异域数据。

translated by 谷歌翻译

3D-Aware Video Generation

Sherwin Bahmani , Jeong Joon Park , Despoina Paschalidou , Hao Tang , Gordon Wetzstein , Leonidas Guibas , Luc Van Gool , Radu Timofte

分类：计算机视觉 | 机器学习

2022-06-29

生成模型已成为许多图像合成和编辑任务的基本构件。该领域的最新进展还使得能够生成具有多视图或时间一致性的高质量3D或视频内容。在我们的工作中，我们探索了学习无条件生成3D感知视频的4D生成对抗网络（GAN）。通过将神经隐式表示与时间感知歧视器相结合，我们开发了一个GAN框架，该框架仅通过单眼视频进行监督的3D视频。我们表明，我们的方法学习了可分解的3D结构和动作的丰富嵌入，这些结构和动作可以使时空渲染的新视觉效果，同时以与现有3D或视频gan相当的质量产生图像。

translated by 谷歌翻译

Manifold embedding data-driven mechanics

Bahador Bahmani , WaiChing Sun

分类：机器学习

2021-12-18

本文介绍了一种新的数据驱动方法，利用由可逆神经网络产生的歧管嵌入，以提高具有有限数据的无组则无法模拟的鲁棒性，效率和准确性。我们通过培训深度神经网络来实现这一点，以将来自本组成歧管的全局映射到下一维欧几里德矢量空间。因此，我们建立了映射欧几里德矢量空间的规范与歧管的度量之间的关系，并导致更具物理上一致的材料数据距离概念。这种处理允许我们绕过昂贵的组合优化，当数据丰富并且高维时，这可能会显着加速无模型模拟。同时，当数据稀疏或在参数空间中不均匀地分布时，嵌入的学习还提高了算法的稳健性。提供了数值实验以证明和测量不同情况下歧管嵌入技术的性能。比较了从所提出的方法获得的结果和通过经典能量规范获得的结果。

translated by 谷歌翻译

Towards Robust and Adaptive Motion Forecasting: A Causal Representation Perspective

Yuejiang Liu , Riccardo Cadei , Jonas Schweizer , Sherwin Bahmani , Alexandre Alahi

分类：机器学习 | 人工智能 | 计算机视觉 | 机器人

2021-11-29

学习来自观察数据的行为模式一直是运动预测的遗传方法。然而，目前的范式遭受了两种缺点：协会变化下的脆性和知识转移的低效。在这项工作中，我们建议从因果表现形式解决这些挑战。我们首先介绍了运动预测的因果形式主义，这将问题作为一种动态过程，其中三组潜在变量，即不变的机制，风格混乱和虚假功能。然后我们介绍一个学习框架，分别对待每个组：（i）与从不同地点收集的数据集的共同做法不同，我们通过不变性的损失来利用它们的微妙区分，鼓励模型抑制虚假相关; （ii）我们设计了一种模块化的架构，可以修理不变机制和风格混淆的表示，以近似因果图; （iii）我们介绍了一种风格的一致性损失，不仅强制实施了风格表示的结构，而且还用作自我监控信号，以便在飞行中进行测试时间改进。合成和实时数据集的实验结果表明，我们的三个提出的组件显着提高了学习运动表示的鲁棒性和可重用性，优于出现的先前最先进的运动预测模型，用于分发外概括和低次转移。

translated by 谷歌翻译

Towards Low-Cost and Efficient Malaria Detection

Waqas Sultani1 , Wajahat Nawaz , Syed Javed , Muhammad Sohail Danish , Asma Saadia , Mohsen Ali

分类：计算机视觉

2021-11-26

疟疾，一种致命但可治愈的疾病每年索赔数十万人生命。早期和正确的诊断对于避免健康复杂性至关重要，但这取决于昂贵的显微镜和培训专家分析血液涂抹幻灯片的可用性。基于深度学习的方法可能不仅可以降低专家的负担，而且还提高了低成本显微镜的诊断准确性。但是，由于没有合理的大小数据集，这是阻碍的。最具挑战性的方面之一是专家不愿意在低成本显微镜下以低放大率注释数据集。我们提出了一种数据集，以进一步研究低放大率低成本显微镜的疟疾显微镜。我们的大型数据集由来自几种疟疾感染患者的血液涂抹幻灯片的图像组成，通过显微镜在两种不同的成本谱和多个放大倍数中收集。用于在高放大率下通过高成本显微镜收集的图像的定位和寿命分类任务的疟原虫细胞。我们设计了一种机制，将这些注释从高倍率从高倍率转移到低成本显微镜，多倍放大。多个对象探测器和域适配方法作为基准。此外，引入了部分监督的域适配方法以使对象检测器适应从低成本显微镜收集的图像上的工作。该数据集将在发布后公开可用。

translated by 谷歌翻译

Lexicon-constrained Copying Network for Chinese Abstractive Summarization

Boyan Wan , Mishal Sohail

分类：自然语言处理

2020-10-16

复制机制允许序列到序列模型从输入中选择单词并将它们直接放入输出中，这在抽象总结中发现越来越多的使用。但是，由于汉语句子中没有明确的分隔符，所以最现有的中国抽象摘要模型只能执行字符副本，从而导致效率低下。为了解决这个问题，我们提出了一个词典约束的复制网络，在编码器和解码器中模拟多粒度。在源端，单词和字符使用变换器基编码器聚合到相同的输入存储器中。在目标方面，解码器可以在每个时间步骤复制字符或多字符字，并且解码过程由一个词增强的搜索算法引导，其促进并行计算并鼓励模型复制更多单词。此外，我们采用单词选择器来集成关键字信息。实验结果在中国社交媒体数据集显示我们的模型可以独立或使用单词选择器。这两种形式都可以胜过以前的基于角色的模型并实现竞争性表现。

translated by 谷歌翻译